智能论文笔记

Evaluation of Semantic Answer Similarity Metrics

Farida Mustafazade , Peter Ebbinghaus

分类：自然语言处理 | 人工智能 | 机器学习

2022-06-25

现有的通用机器翻译或自然语言生成评估指标有几个问题，在这种情况下，提问（QA）系统无动于衷。为了构建强大的质量检查系统，我们需要具有等效鲁棒评估系统的能力，以验证对问题的模型预测是否类似于地面真相注释。比较基于语义而不是纯字符串重叠的相似性的能力对于公平比较模型并指出现实生活应用中更现实的接受标准很重要。我们首先建立在我们的知识论文的基础上，该论文使用基于变压器的模型指标来评估语义答案的相似性，并在没有词汇重叠的情况下实现与人类判断的更高相关性。我们提出了跨编码器增强双重编码器和Bertscore模型，以进行语义答案相似性，该模型在新的数据集中进行了培训，该数据集由美国公共人物的名称对组成。就我们而言，我们提供了第一个共同参考名称字符串对的数据集及其相似性，可用于培训。机器学习与应用第四届机器学习与应用国际会议（CMLA 2022）6月25日至2022年6月25日，哥本哈根，丹麦批量编辑：David C. Wyld，Dhinaharan Nagamalai（EDS）

translated by 谷歌翻译

牙齿分割是牙科修复体中的一个重要主题，这对于牙冠的产生，诊断和治疗计划至关重要。在牙科字段中，输入数据的可变性很高，没有公开可用的3D牙科拱门数据集。尽管最近对3D数据的深度学习体系结构提供的领域有所改善，但仍然存在一些问题，例如正确识别拱门中缺失的牙齿。我们建议将光谱聚类用作自我探测信号，以将3D拱门分割的联合训练神经网络进行分割。我们的方法是通过观察到的，即K-均值聚类提供了捕获与人类感知相关的边缘线的线索。主要思想是通过将未标记的3D拱门分解为仅依靠几何信息的细分市场来自动生成训练数据。然后，使用关节损失对网络进行训练，该联合损失结合了注释输入的监督损失和无标签输入的自制损失。我们收集的数据有多种拱门，包括牙齿缺失的拱门。我们的实验结果表明，在使用半监督学习时，对完全监督的最先进的meshsegnet进行了改善。最后，我们贡献代码和数据集。

translated by 谷歌翻译